بکارگیری تکنیکهای پردازش زبان طبیعی برای تطبیق سوال در سیستمهای پرسش و پاسخ فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر
- نویسنده سارا ایزدی بروجنی
- استاد راهنما محمد قاسم زاده علی محمد زارع بیدکی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
از جنبه های مهم در فناوری اطلاعات، امکان یافتن پاسخ سوالات از بستره های آن میباشد. فضای اینترنت شامل حجم عظیمی از اطلاعات و از آن جمله جفتهای پرسش و پاسخ است. لذا این قابلیت که بتوان سوال معادل و یا سوال مشابه با سوال کاربر را به سرعت یافته و پاسخ مربوطه را ارائه داد اهمیت ویژه ای یافته است. در این زمینه کوششهایی برای سایر زبانها صورت پذیرفته و آن جام آن برای زبان فارسی نیز الزامی میباشد. در روشهای ارائه شده برای تطبیق سوال، روشهای مبتنی بر پردازش زبانهای طبیعی و بازیابی اطلاعات بالاترین کارایی را دارند. در این پژوهش روشی مبتنی بر ترکیب فضای برداری و تعمیمی از مدلهای زبانی بای گرم و تری گرم برای تطابق سوال فارسی ارائه میگردد. روش مورد نظر پیاده سازی و بر روی دادههای محک انبوه ارزیابی شده اند. دادههای محک شامل بایگانی سرویس پرسش و پاسخ برخط راسخون، که حاوی بیش از هجده هزار جفت پرسش و پاسخ است، میباشد. حجم پردازش و سایز ورودی لزوم به کارگیری الگوریتمهای کارآمد با درجه پیچیدگی زمانی و هم چنین درجه پیچیدگی حافظه پایینتری را ملزم میداشت که از جمله نتایج این تحقیق میباشند. از آن جایی که تمرکز اصلی در این تحقیق، ارزیابی کارایی مدلهای زبانی است، میزان بهبود تطابق سوال نسبت به روشی که تنها فضای برداری استفاده شود نیز مقایسه شده است. نتایج این مقایسه نشان از بهبود معیارهای دقت و فراخوانی با استفاده از مدلهای زبانی ارائه شده است. کارایی این مدل را میتوان تا حدود زیادی شبیه به کارایی مدلهای تطبیق سوال ارائه شده در سایر زبانها دانست که اکثر این مدلها، از ابزارهای پیشرفته پردازش زبان طبیعی استفاده میکنند.
منابع مشابه
ارایه یک پیکره پرسش و پاسخ مذهبی در زبان فارسی
Question answering system is a field in natural language processing and information retrieval noticed by researchers in these decades. Due to a growing interest in this field of research, the need to have appropriate data sources is perceived. Most researches about developing question answering corpus area have been done in English so far, but in other languages as Persian, the lack of these co...
متن کاملبهبود خلاصه سازی خودکار متون فارسی با استفاده از روشهای پردازش زبان طبیعی و گراف شباهت
A significant amount of available information is stored in textual databases which contains a large collection of documents from different sources (such as news, articles, books, emails and web pages). The increasing visibility and importance of this class of information motivates us to work on having better automatic evaluation tools for textual resources. The automatic summarization of tex...
متن کاملپردازش جمله و بازنمود ذهنی فعل در زبان فارسی
پژوهش حاضر به مطالعه چگونگی فرایند پردازش فعل در زبان فارسی به هنگام درک شنیداری جمله میپردازد.سؤال اصلی پژوهش این است که آیا پیچیدگی بازنمودی فعل فارسی در واژگان بر مدت زمان پردازش آن به هنگام درک شنیداری جمله مؤثر است یا خیر.مفهوم پیچیدگی واژگانی افعال بر مبنای اطلاعات ساختاری(نحوی) و واژگانی (معنایی) موجود در مدخل واژگانی افعال تعریف شده است.ابزار مورد استفاده در این تحقیق تکلیف تصمیمگیری ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه یزد - دانشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023